Manipulation de données bibliométriques via {managHAL}

Martin AMIENS

MIA - Paris-Saclay

2024-04-07

Martin AMIENS

  • Stagiaire au sein de l’unité MIA - Paris-Saclay.
  • Etudiant en première année du master Bio-Informatique et Bio-Statistiques à Paris-Saclay.
  • Tuteurs : Julie AUBERT, Pierre BARBILLON

Plan

  • Contexte du stage
  • Objectifs du stage
  • Accessibilité et généricité de {managHAL}
  • introduction aux Réseaux
  • Ajout de fonctionnalités à {managHAL}
  • Perspectives et avenir du package

Contexte

  • DRIT : Direction des Recherches et de l’Innovation Technologique
  • Sciences Ouvertes : sont “la diffusion sans entrave des publications et des données de la recherche.” (plan-national-pour-la-science-ouverte,2021)
  • HAL : Hyper Articles en Ligne

Crédit : CCSDForge
  • {ManagHAL} : Package R d’extraction de données bibliométriques de HAL

Objectifs du stage

  • Accessibilité et généricité de {managHAL}
  • Ajout de fonctionnalités à {managHAL}

Accessibilité et généricité de {managHAL}

Exemple d’URL : “https://api.archives-ouvertes.fr/search/hal/?q=structId_i:1002311&fq=publicationDate_tdate:[2022-01-01T00:00:00Z%20TO%202023-01-01T23:59:59Z]&fq=docType_s:(COMM+OR+ART … &sort=producedDate_tdate+desc&fl=docid,halId_s,version_i,docType_s,citationFull_s … &defType=edismax&rows=1000”

Accessibilité et généricité de {managHAL}

# A tibble: 3 × 13
  civilite nom       prenom statut rattachement  debut_contrat fin_contrat
  <chr>    <chr>     <chr>  <chr>  <chr>         <chr>         <chr>      
1 M.       ADJAKOSSA Éric   CEC    AgroParisTech ""            ""         
2 Mme      AUBERT    Julie  IR     INRAE         ""            ""         
3 M.       BARBILLON Pierre PR     AgroParisTech ""            ""         
# ℹ 6 more variables: financement <chr>, equipe <chr>, unite <chr>,
#   orcid <chr>, idhal <dbl>, adresse_mail <chr>
# A tibble: 1 × 11
    docid halId_s      version_i docType_s citationFull_s          citationRef_s
    <int> <chr>            <int> <chr>     <chr>                   <chr>        
1 4440523 hal-04440523         1 COMM      Isabelle Lebert, Maxim… Colloque fin…
# ℹ 5 more variables: publicationDate_tdate <chr>,
#   authFullNamePersonIDIDHal_fs <chr>, structAcronym_s <chr>,
#   structId_i <chr>, structHasAlphaAuthIdHalPersonid_fs <chr>
# A tibble: 4 × 8
    docid halId_s      version_i docType_s citationFull_s          citationRef_s
    <int> <chr>            <int> <chr>     <chr>                   <chr>        
1 3781287 hal-03781287         1 COMM      Wenfan Cao, Maxime Lec… FOODMICRO 20…
2 3694338 hal-03694338         1 COMM      Wenfan Cao, Maxime Lec… 23ème éditio…
3 3811607 hal-03811607         1 COUV      Julie J. Aubert, Pierr… Statistical …
4 4019111 hal-03604836         1 ART       Sana Romdhane, Aymé Sp… The Internat…
# ℹ 2 more variables: publicationDate_tdate <chr>,
#   authFullNamePersonIDIDHal_fs <chr>

Introduction aux Réseaux

Un réseau est composé de :

  • noeuds (entités)

  • arêtes (interactions entre ces entités)

A : Exemple de Réseau trophique (réseau d’interactions des espèces chiliennes), Crédit : (Kéfi et al. 2016)

B : RAD51 et son réseau d’interactions de sa famille de gènes, Crédits : (Li et al., 2021)

Ajout de fonctionnalités à {managHAL}

construction d’un réseau de co-auteur et SBM

Réseau complet de co-auteurs de l’unité MIA - PS

Réseau complet de co-auteurs de l’unité MIA - PS coloré par appartenance aux groupes

Ajout de fonctionnalité à {managHAL}

Création de sous-groupe

Réseau partiel de co-auteurs de l’unité MIA - PS

Réseau partiel de co-auteurs de l’unité MIA - PS coloré par appartenance aux groupes

Cas d’usage

L’unité MIA - Paris-Saclay 1

présenter le chargement de la table RH (comment on fait au niveau utilisateur)

présenter le chargement des publications à partir d’identifiants auteurs.

présenter le chargement à partir d’un identifiant structure

L’unité MIA - Paris-Saclay 2

présenter la création d’un rapport bibliographique

integrer le lien vers html rapport ?

L’unité MIA - Paris-Saclay 3

présenter les fonctions de nettoyages des données ( + les conclusions que on peut en tirer)

L’unité MIA - Paris-Saclay 4

présenter la création de réseau

L’unité MIA - Paris-Saclay 5

présenter le sbm

Questions importantes à poser

Perspectives et avenir du package

  • Création et optimisation des fonctions permettant la création d’un réseau à partir des données

  • Création et optimisation des fonctions permettant la création d’un modèle à partir du réseau obtenu

Merci de m’avoir écouté

sources

https://www.ouvrirlascience.fr/plan-national-pour-la-science-ouverte/